2003. 6. 과학기술 정보 시스템 개발 사업


지식 정보의  상호운영성 제고를 위한 정보 공유 기술 개발


김   현(KISTI 정보시스템부장)


  1. 정보 시스템 개발 사업 추진 방향


  일반적인 과학기술 연구 과정을 두 가지 단계로 나누어 본다면, 그것은 첫째 과거로부터 현재까지의 연구 성과를 수집 분석하여 관련 기술의 현주소를 올바로 파악하는 일일 것이며, 두 번째는 그와 같은 조사 연구의 토대 위에서 정립된 연구 목표에 따라 지금까지 얻어내지 못했던 새로운 과학적 성과를 얻기 위해 가설을 세우고 실험을 하여 그 이론을 입증해 내는 과정일 것이다.  KISTI의  R&D 정보 인프라 구축 사업은 그와 같은  과학기술 연구자들의 두 가지 연구 개발 과정이 전자적(Electronic)인 환경에서 보다 효율적으로 이루어질 수 있도록 지원하는 것을 목표로 한다. 이 가운데 후자를 위해서는 슈퍼 컴퓨팅 센터를 중심으로 고성능 컴퓨터와 초고속 네트워크를 이용하여 전자적인 연구 개발 환경을 조성하는  e-R&D 인프라 구축 사업이 수행되고 있으며, 전자를 위해서는 정보유통부, 정보분석부, 정보시스템부 3개 부서가 협력하여 전자적인 정보 활용 체제를 구축하는 사업을 수행하고 있다.

  KISTI가 추구하는 전자적 정보 활용 체제는, 공개적 간행 과정을 거친 문헌 정보이건, 아니면 아직 공론화되지 않은 암묵적 지식 정보이거나 간에 연구 활동에 필요한 지식 자원이라고 한다면 시간과 비용의 낭비 없이 전자적인 정보 유통 환경 안에서 그것을 획득하여 활용할 수 있게 하는 것을 의미한다. 이 때에 연구자들이 필요로 하는 가치 있는 정보 자원을 사전에 발굴하고 수집하여 디지털 정보 자원으로 구축하는 일이 정보유통부의 업무이고, 기술 정보에 대한 심층 분석을 통해 연구 개발 및 산업적 실용화의 최신 동향에 대한 전문 지식을 제공하는 것이 정보분석부의 과제라고 한다면, 정보시스템부에서 수행하는 일은 그와 같은 과학기술 연구 개발 정보가 연구개발자들 사이에서 최단시간 내에 전자적인 방법으로 공유될 수 있게 하는 기술을 개발하는 것이다.

  이러한 점에서 볼 때, KISTI 정보 시스템부는 타 부서의 연구 사업으로부터 독립된 과제를 수행한다기보다 정보의 수집, 분석, 공유 업무를 보다 효율적으로 수행할 수 있게 하는 기술적 지원을 첫 번째 사업 목표로 삼는다고 할 수 있다. 정보 시스템부에서 지속적으로 담당하고 있는 “과학기술 정보 시스템 개발 사업”의 상당 부분은 KISTI의 과학기술 정보 서비스 고도화를 위한 기술 개발 및 시스템 운영 지원이다.  그러나 이 시스템 개발 사업은 단순히 현재 운영되고 있는 정보 관리, 정보 서비스 시스템을 지속적으로 업그레이드 하는 수준에 머무는 것이 아니라, 정보 유통 인프라의 체제 개편을 주도하는 혁신적인 연구 개발 업무로서 추진되어야 한다는 당위성을 안고 있다.

   “정보 시스템 개발 사업”이 이처럼 현행 정보 유통 사업의 기술적 지원이라는 2선 기능을 수행하면서, 동시에 그 정보 유통 체제를 개편하는 선도적인 기술 개발을 이루어야 하는 이유는 오늘날의 정보 환경의 급격한 변화상에 기인한다.  무엇보다도 인터넷의 확산으로 인해 지식 자원의 생산과 유통에 직․간접적으로 관계하는 조직이 과거와는 비교할 수 없이 다변화되었으며, 이들 사이에서 오고가는 정보량이 폭발적으로 증대하였기 때문에 오늘날에는 어느 한 조직도 과학 기술 정보 자원의 망라적인 수집 관리가 불가능한 상황이다. 이러한 현실은 KISTI와 같은 “정보 센터”의 기능이 종래의 “정보 수집․공급자”(Information Aggregator & Provider)의 역할에서 디지털 정보 자원의 자율적 유통 환경(Digital Open Marketplace)을 조성․운영하는 역할로 전환되어야 할 필요성을 낳게 하였다. 이러한 변화상에 부응하여 KISTI 정보 시스템부는 미래지향적인 정보 유통 시스템 개발의 목표를  “과학기술 지식의 생산자-수요자 간 자율적인 디지털 정보 공유를 지원하는 전자적 정보 유통 환경(Electronic Open Marketplace)의 구현”에 두고, 이를 실현하기 위한 선도적 요소 기술을 개발하는 데에 주력하고 있다.


   2. 정보 시스템 개발 사업의 내용


  정보 시스템 개발 사업의 2003년도 세부 과제는 세 가지로 추진되고 있는데, 그것은 “정보 서비스 시스템 개발 및 운영”, “전자 정보 유통 기술 개발” 및 “지식 관리 시스템 개발 연구” 등이다.  이 가운데 첫 번째 과제인 “정보 서비스 시스템 개발 및 운영” 사업을 통해서는  KISTI 및 KISTI와 협력 관계를 유지하고 있는 과학기술 분야 전문 정보 센터(정부출연연구소, 과제관리기관, 분야별 전문 학회에 설치)에서 생산한 과학기술정보자원의 데이터베이스 구축/관리와 온라인 서비스 지원을 위한 응용 프로그램 개발(이상 과학기술정보 종합서비스 시스템 개발 및 운영 소과제), KISTI 정보 서비스 사업을 위한 서버 및 네트워크 장비의 안정적 운영 및   성능 고도화,  민간정보센터의 공공적 지식자원서비스 활성화를 위한 인프라 지원 서비스(이상 정보서비스 시스템 서버 운영 체제 고도화 소과제) 등의 업무를 수행하고 있다.

  두 번째 과제 “전자 정보 유통 기술 개발” 사업을 통해서는 OPEN URL, DOI 등 디지털 오브젝트 식별 체계를 활용한 전자 원문 연계 서비스 기술의 구현, DOI RA 기능 수행을 통한 국내외 원문 보유 기관간의 원문 연계 활용 체제 구축 연구(이상 전자원문식별체계 응용 기술 개발 소과제), KISTI 정보서비스시스템 상에서 해외 주요 전자원문보유 조직의 유상 디지털 자원을 상시 활용할 수 있게 하는 ONE-STOP 관문 서비스의 구현(이상 해외 전자 원문 관문 서비스 시스템 개발 소과제) 등을 추진하고 있으며,

  세 번쩨 세부과제 “지식 관리 시스템 개발 연구”를 통해서는 구조적 정보 자원의 편찬과 검색 서비스를 일원화하여 정보 생산과  정보 유통의 시간차를 해소하는 기술 개발 연구, 한국어 정보 자원의 지능적 활용 및 한국어를 매개로 한 외국어 정보 자원의 검색 효율을 높이기 위한 기술 개발 및 기반 언어 자원 구축 (이상 정보 검색 관리 시스템 개발 연구 소과제),  P2P 기반 연구 지식 정보 공유 체제 구축 연구, 메타 데이터 레지스트리 운영을 통한 지식 정보 연계 활용 기반 구축 연구, 정부 출연(연) 연구개발사업 성과 정보 관리 시스템의 개발 보급(이상 연구개발 지식관리 시스템 구축 소과제) 등의 업무에 주력하고 있다.


  KISTI의 정보 시스템 개발 사업의 내용은 현행 정보 서비스 시스템의 유지 관리 에서부터 차세대 정보 유통 시스템 구축을 위한 첨단 기술 연구에 이르기까지 넓은 범위에 걸쳐 있으나, 모든 세부과제 및 소과제는 긴밀한 상호 연계 체계를 유지하며 각각의 연구 및 사업 성과가 하나의 종합적인 시스템을 구축하는 방향으로 진행되고 있다. 그 궁극의 목표가 되는 종합적인 시스템은 “정보의 생산에서부터 보급․ 활용에 이르는 정보 유통의 전 주기가 컴퓨터와 네트워크를 기반으로 하는 전자적 환경에서 단절 없이 이어지는 체제이며, 인력에 의존하는 정보 수집의 중간 과정을 최소화하여 생산자에게서 만들어진 정보가 사이버 공간만을 경유하여 그 정보의 수요자에게 바로 전달될 수 있도록 하는 환경”이다.


  3. 지식 정보의 상호운영성 제고를 위한 중점 추진 업무


  연구 활동의 현장에서 만들어지는 지식 정보가 곧바로 그 지식의 수요자에게 활용될 수 있도록 하는 것은 그 정보 자료를 디지털 신호로 변환하는 것으로만 되는 것은 아니다. 생산자, 수요자 모두 다양한 조직에 속해 있고, 상이한 정보 환경에 처해 있기 때문에 어느 한 곳에서 전자화된 정보가 만들어졌다는 사실이 다른 곳에서 그것을 바로 활용할 수 있게 되는 것을 보장하지는 않는 것이다. 여기서 제기되는 것이 바로 디지털 자원의 상호운영성 문제이다.  문헌 정보의 경우 과거에는 정보 센터에서 자체적인 기준에 의해 목록 정보 DB를 만들고 전자적 원문 데이터를 생산해 내며, 그러한 자원을 서비스하기 위한 독자적인 소프트웨어를 개발․운영하였고, 이용자들도 정보 센터에 따라 상이한 체제로 가공된 자료를 접하는 데 익숙해져 있었다. 하지만 그것은 정보를 제공하는 공급원이 한정된 몇 군데에 불과하던 시절에 용인될 수 있었던 일이다. 오늘날의 지식 정보 수요자는 수 만 군데 다양한 정보원들이 제 각각 조각난 지식 정보를 제공할 뿐, 그것을 종합적으로 획득하거나 연계해서 활용할 방법이 없다는 사실에 대해 더 이상 관용적이지 못하다.

  이와 같은 상황에서 KISTI와 같은 정보 센터에게 부여된 과제는 독자적인 형태의 데이터베이스 구축이나 시스템 개발이 아닌, 국가적 그리고 국제적인 상호운영성을 보장하는 콘텐트 개발과 유통 시스템의  구축이다.

  정보 유통 시스템의 상호운영성 증진을 위해 정보시스템부에서 당해연도에 추진하는 사업 가운데 하나는 KISTI를 경유하는 모든 디지털 자원이 사이버 공간 상에서 공개적으로 통용되는 고유 식별자를 매개로 유통될 수 있도록 하는 디지털 콘텐트 식별자 인식 시스템의 구축이다. 이는  KISTI가 보유한 정보 자원을 단지 KISTI를 통해서만 획득하는 것이 아니라, 다른 연구 기관이나 정보 센터의 정보 시스템 상에서도 그것이 마치 그 기관이 보유한 자료인 것처럼 자유롭게 활용할 수 있게 하는 결과를 수반한다. 동일 또는 유사한 정보 자원을 중복해서 저장하지 않고도 각각의 조직이 그것을 자체적으로 보유하고 있는 것이나 다름없이 하기 위해서는 개개의 정보 자원이 시스템의 상이성에 구애받지 않고 어디서나 열람될 수 있도록 하는 장치가 필요하다. 이를 위해 KISTI는 자체적으로 구축한 국내 고유 정보 자원(국내 학회지 학술 논문 및 국가 연구개발사업 연구보고서의 전자 원문 등)부터 외부의 어느 정보 시스템에서든 네트워크를 통해 그것을 획득할 수 있도록 개개의 자원을 디지털 오브젝트화 하고, 공개된 고유 식별자를 이용하여 디지털 자원을 상시 획득할 수 있도록 하는 표준 프로토콜을 제정하는 등의 업무를 수행하고 있으며, KISTI 디지털 콘텐트 식별자가 DOI 등 국제적인 식별 체계와 상호운영성을 가질 수 있는 체제를 마련하고 있다.

  정보시스템부에서 역점을 두어 추진하고 있는 메타 데이터 레지스트리 기반 정보 시스템 개발 사업 역시 정보 자료의 상호운영성 증진을 위한 것이다. 유관한 내용의 정보 데이터베이스를 개발하는 모든 조직들이 사전에 약속된 표준적인 데이터 스키마를 적용한다면 정보 자원의 상호운영성은 말할 것도 없이 크게 신장될 것이다. 그러나 그와 같은 방식의 강제적인 사전 통제는 현실적으로 가능하지 않다. 정보 DB를 만드는 기관마다 여건과 목표가 다르기 때문이다. 차선의 대안은 각각의 정보 DB에 대해 그 형식과 내용을 명시적으로 서술해 주는 메터 데이터를 만들어서 이를 공유하되, 그 메터 데이터의만큼은  기계적인 인식까지 가능하도록 표준화된 형식을 준수한다는 것이다. 시스템부에서는 KISTI에서 구축한 각종 데이터베이스가 유관한 내용의 다른 정보 DB와 연계하여 활용될 수 있도록 그 형식과 내용을 국제적인 표준 규약(ISO 11179)에 따라 표현하는 메터 데이이터 레지스트리 구축 연구를 수행하고 있다.

  정보시스템부에서 지속적으로 개발해 온 UNI CODE, XML 기반 정보 편찬․검색 시스템은 금년에 멀티 스키마 지원, 교차 언어 검색 지원, 유사 문서 자동 분류 지원, 메터 데이터 레지스트리를 활용한 분산 검색 기능 등이 가능한 고기능 정보 시스템으로 새롭게 태어날 예정이다. 정보 콘텐트의 상호운영성 제고를 위해 텍스트 구조와 그 속의 구성 요소를 명시적으로 표현하는 마크업 기법인 XML와 폭넓게 도입되어야 한다는 점에서는 대부분의 정보 전문가들이 인식을 같이한다. 그러한 현재까지의 기술적 솔루션들은 XML 문서의 제작과 데이터베이스 구축 및 정보 검색 서비스에 대해 각각 독립적인 처리 방법만을 제공해 왔을 뿐이다.  XML을 문서를 기반으로 대용량 DB를 구축하고 그것을 2차적인 가공이나 변환 없이 정보 검색 서비스에 그대로 활용할 수 있게 하는 KRISTAL 2002 시스템은 우리나라  정보 콘텐트 개발의 표준화, 서비스 기능의 고도화에 크게 기여할 수 있을 것으로 기대 된다.



<2003년도 정보 시스템 개발 사업 수행 과제>



<KISTI 과학기술 정보 데이터 관리 시스템 운영 프로세스>



<디지털 콘텐트 식별자를 기반으로 한 전자 원문 공유 지원 체제>



<연구개발 지식 관리 시스템 구성도>



<KRISTAL 정보 편찬․검색 시스템의 기능>